@词向量→物体特征Semantic projection recovers rich human knowledge of multiple object features from word embeddings

Cm:: 有没有可能创建一个评价书面、口语的轴,然后映射不同的词?以及,是否可以衡量诸如“红”和“红红的”这种语法意义?

## 摘要

本文提出并验证了一种名为“语义投射” (Semantic Projection) 的强大方法,证明了标准词嵌入模型(如 GloVe)的几何结构中,显式地 (explicitly) 编码了关于世界物体的多维度、依赖上下文 (context-dependent) 的精细知识。

传统上,词嵌入被认为只能衡量词语间笼统的、单一的“相关性”。然而,本文通过将词向量投射到由反义词对定义的“特征轴”(例如,从smallbig的向量)上,成功地、稳健地预测了人类在特定维度(如尺寸、危险性、性别倾向等)上的判断。这一发现不仅为词嵌入的应用提供了新的思路,更对我们理解语言如何塑造概念知识以及人类心理词库 (mental lexicon) 的丰富性提出了深刻的见解。


# 1. 引言:问题的提出


# 2. 方法论:语义投射 (Semantic Projection)


# 3. 实验设计与结果

3.1 主要结果

3.2 稳健性检验 (Robustness Checks)


# 4. 讨论与深层意义